Iterative text revision improves text quality by fixing grammatical errors, rephrasing for better readability or contextual appropriateness, or reorganizing sentence structures throughout a document. Most recent research has focused on understanding and classifying different types of edits in the iterative revision process from human-written text instead of building accurate and robust systems for iterative text revision. In this work, we aim to build an end-to-end text revision system that can iteratively generate helpful edits by explicitly detecting editable spans (where-to-edit) with their corresponding edit intents and then instructing a revision model to revise the detected edit spans. Leveraging datasets from other related text editing NLP tasks, combined with the specification of editable spans, leads our system to more accurately model the process of iterative text refinement, as evidenced by empirical results and human evaluations. Our system significantly outperforms previous baselines on our text revision tasks and other standard text revision tasks, including grammatical error correction, text simplification, sentence fusion, and style transfer. Through extensive qualitative and quantitative analysis, we make vital connections between edit intentions and writing quality, and better computational modeling of iterative text revisions.
translated by 谷歌翻译
通常通过过去的选择来告知机器学习中的评估,例如要使用哪些数据集或指标。该标准化可以使用排行榜对平等基础进行比较,但是随着出现更好的替代方案,评估选择变得不佳。这个问题在自然语言生成中尤其相关,该语言需要不断改善的数据集,指标和人类评估以提出确定性的主张。为了使遵循最佳模型评估实践更加容易,我们介绍了GEMV2。新版本的一代,评估和指标基准为数据集,模型和指标开发人员提供了模块化基础架构,以使彼此受益。GEMV2支持40种记录的数据集中51种语言。所有数据集的模型都可以在线评估,我们的交互式数据卡创建和渲染工具使得在Living Benchmark中添加新数据集变得更加容易。
translated by 谷歌翻译
修订是人类写作过程的重要组成部分。它往往是战略性的,适应性的,更重要的是迭代性质。尽管大型语言模型在文本修订任务上取得了成功,但它们仅限于非著作,单次修订。研究和评估大语言模型进行连续修订和与人类作家合作的能力是建立有效写作助手的关键一步。在这项工作中,我们提出了一个人类的迭代文本修订系统,阅读,修订,重复(R3),旨在通过阅读模型生成的修订和用户反馈,以最少的人为努力来实现高质量的文本修订,修改文件,重复人机相互作用。在R3中,文本修订模型为人类作家提供了文本编辑建议,他们可以接受或拒绝建议的编辑。然后将所接受的编辑纳入模型,以进行下次文档修订版。因此,作家可以通过与系统进行交互并仅接受/拒绝其建议的编辑来修改文档,直到文本修订模型停止进行进一步修订或达到预定义的最大修订数量。经验实验表明,R3可以在早期的修订深度与人类作家进行可比的接受率进行修订,并且人机相互作用可以通过更少的迭代和编辑来获得更高质量的修订。收集的人类模型交互数据集和系统代码可在\ url {https://github.com/vipulrraheja/iterater}中获得。我们的系统演示可在\ url {https://youtu.be/lk08tipeoae}上获得。
translated by 谷歌翻译
近年来,高吞吐量筛选的进步,对更复杂的化学设计空间的可访问性以及准确的分子建模框架的发展,近年来快速发现了新的反应和分子。因此,对不断增长的化学文献进行的整体研究是必需的,该研究重点是理解最近的趋势并将其推断到可能的未来轨迹中。为此,已经报道了几项基于网络理论的研究,该研究使用了化学反应的定向图表示。在这里,我们根据代表化学反应作为超图表的研究进行了一项研究,其中超蛋白代表化学反应,节点代表参与分子。我们使用标准反应数据集来构建超网络,并报告其统计数据,例如学位分布,平均路径长度,分类性或程度相关性,pagerank中心性和基于图的集群(或社区)。我们还计算了每个统计量的反应的等效的有向图表示,以绘制相似之处并突出两者之间的差异。为了证明超图反应表示的AI适用性,我们生成致密的超透明嵌入,并将其用于反应分类问题。我们得出的结论是,超网络表示是灵活的,可以保留反应环境,并发现了隐藏的见解,这些洞察力在传统的化学反应的传统图形表示中却不明显。
translated by 谷歌翻译
In recent times, Variational Quantum Circuits (VQC) have been widely adopted to different tasks in machine learning such as Combinatorial Optimization and Supervised Learning. With the growing interest, it is pertinent to study the boundaries of the classical simulation of VQCs to effectively benchmark the algorithms. Classically simulating VQCs can also provide the quantum algorithms with a better initialization reducing the amount of quantum resources needed to train the algorithm. This manuscript proposes an algorithm that compresses the quantum state within a circuit using a tensor ring representation which allows for the implementation of VQC based algorithms on a classical simulator at a fraction of the usual storage and computational complexity. Using the tensor ring approximation of the input quantum state, we propose a method that applies the parametrized unitary operations while retaining the low-rank structure of the tensor ring corresponding to the transformed quantum state, providing an exponential improvement of storage and computational time in the number of qubits and layers. This approximation is used to implement the tensor ring VQC for the task of supervised learning on Iris and MNIST datasets to demonstrate the comparable performance as that of the implementations from classical simulator using Matrix Product States.
translated by 谷歌翻译
自我监督的表示学习技术利用大型数据集,而没有语义注释来学习有意义的,通用的功能,这些功能可以方便地转移以解决各种下游监督任务。在本文中,我们提出了一种自我监督的方法,用于学习从未标记的GPS轨迹的地理位置来求解下游地理空间视觉任务任务。由地球表面的栅格表示产生的瓷砖被建模为图像的图或像素上的节点。将GPS轨迹建模为允许在这些节点上的马尔可夫路径。提出了一种可扩展和分布的算法,以计算图像样的张量,称为可及性摘要,该图像摘要是瓷砖与其邻居之间的空间连通性模式所隐含的。培训了一个卷积,承包自动编码器,以学习每个瓷砖的可及性摘要的压缩表示形式,称为可及性嵌入。可及性嵌入用作任务无关的,地理位置的特征表示。使用可及性嵌入作为五个不同下游地理空间任务的像素表示,作为监督语义分割问题,我们定量证明,可及性嵌入性具有语义上有意义的表示,并在绩效中获得4-23%的增长,同时使用高达67%的轨迹数据,较小的轨迹数据,较小的轨迹数据,较小的轨迹数据,与基线模型相比,使用Precision-Recall曲线(AUPRC)度量的面积测量,这些模型使用了不考虑瓷砖之间空间连接性的像素表示。可及性嵌入将顺序的时空迁移率数据转化为具有语义上有意义的图像张量表示,这些表示器可以与其他图像来源结合使用,并旨在促进地理空间计算机视觉中的多模式学习。
translated by 谷歌翻译